Homología de secuencia

Un alineamiento de secuencias de dos proteínas, obtenido a través de ClustalW.

En genética y biología molecular, la homología de secuencias se refiere a la situación en la que las secuencias de dos o más proteínas o ácidos nucleicos son similares entre sí debido a que presentan un mismo origen evolutivo. Usualmente se puede concluir que dos secuencias son homólogas sobre la base de la alta similitud que las mismas presentan. No obstante, la similitud de secuencias es un resultado que proviene directamente de la observación, mientras que la homología es una interpretación de que una alta similitud entre dos secuencias se debe a que las mismas poseen un origen común. De hecho, una alta similitud de secuencias puede deberse simplemente al azar (en las secuencias cortas por ejemplo).

Existen varios algoritmos para agrupar secuencias en familias, las cuales son juegos de secuencias mutuamente homólogas (véase, alineamiento de secuencias y Anexo:Software para alineamiento de secuencias). Algunas de las bases de datos biológicas que colectan secuencias homólogas en genomas animales son, por ejemplo, HOVERGEN,^[1] HOMOLENS,^[2] HOGENOM.^[3]

En la rama genómica de la bioinformática, se usa el concepto de homología de secuencias para predecir la función de un gen: si la secuencia de gen A, cuya función es conocida, es homóloga a la secuencia de gen B, cuya función es desconocida, puede inferirse que B podría compartir la función de A.^[4] En la rama estructural de la bioinformática, la homología se usa para determinar qué partes de una proteína son importantes en la formación de la estructura y en la interacción con otras proteínas. En la técnica denominada modelado por homología, esta información se usa para predecir la estructura de una proteína una vez conocida la estructura de una proteína homóloga.^[5]

Tipos de secuencias homólogas

Las secuencias homólogas pueden ser ortólogas o parálogas.^[6]

Genes o secuencias ortólogas

Las secuencias o genes ortólogos son aquellas secuencias homólogas que se han separado por un evento de especiación. Es decir, cuando una especie diverge en dos especies separadas, se dice que las copias divergentes de un mismo gen en las especies resultantes son ortólogas. En otras palabras, las secuencias ortólogas son las secuencias que se encuentran en diferentes especies y que son altamente similares debido a que se han originado en un antepasado común.^[7]

La evidencia más concluyente de que dos genes similares son ortólogos es el resultado del análisis filogenético sobre el linaje de ese gen. Los genes que se encuentran dentro del mismo clado son ortólogos ya que descienden del mismo ancestro. Los genes ortólogos usualmente, pero no siempre, tienen la misma función.

Las secuencias ortólogas proveen información útil en taxonomía y en estudios filogenéticos. Puede utilizarse el patrón de divergencia genética para inferir las relaciones existentes entre especies. Dos especies que se hallan estrechamente relacionadas tendrán secuencias de ortólogos altamente similares. Por el contrario, dos especies filogenéticamente alejadas presentarán una gran divergencia en la secuencia de los genes o secuencias ortólogas bajo estudio.

Algunas otras bases de datos biológicas proveen herramientas para identificar y colectar secuencias ortólogas. Por ejemplo, en eucariotas OrthoMCL,^[8] en mamíferos OrthoMaM,^[9] en plantas OrthologID^[10] y GreenPhylDB^[11]

Mediante técnicas de secuenciación del genoma de distintas especies de ovejas, cabras, ganado, cerdo, camello, perro, ratón y proteínas humanas, se han identificado 4.850 genes ortólogos/ejemplar cuyas familias aparecen representadas en el diagrama de Venn

Genes o secuencias parálogas

Las secuencias homólogas se dicen parálogas si las mismas se hallan separadas por un evento de duplicación. En otras palabras, si un gen de un organismo se duplica para ocupar dos posiciones diferentes en el mismo genoma, entonces las dos copias son parálogas.

Las secuencias o genes parálogos típicamente tienen la misma función o similar; no obstante, muchas veces este no es el caso debido a que no existe la misma fuerza selectiva original sobre la copia duplicada del gen; ésta puede adquirir nuevas funciones por mutación y por selección.

Referencias

↑ HOVERGEN: Homologous Vertebrate Genes Database Archivado el 15 de junio de 2012 en Wayback Machine.
Duret L, Mouchiroud D, Gouy M (junio de 1994). «HOVERGEN: a database of homologous vertebrate genes». Nucleic Acids Res. 22 (12): 2360-5. PMC 523695. PMID 8036164. doi:10.1093/nar/22.12.2360.
↑ HOMOLENS: Homologous Sequences in Ensembl Animal Genomes Archivado el 2 de mayo de 2014 en Wayback Machine.
Penel S, Arigon AM, Dufayard JF, et al. (2009). «Databases of homologous gene families for comparative genomics». BMC Bioinformatics 10 (Suppl 6): S3. PMC 2697650. PMID 19534752. doi:10.1186/1471-2105-10-S6-S3.
↑ HOGENOM : Database of Complete Genome Homologous Genes Families
↑ Pellegrini, M., et al. (1999). «Assigning protein functions by comparative genome analysis: Protein phylogenetic profiles». Proceedings of the National Academy of Sciences (EE.UU.) 96 (8). 4285-4288.
↑ Martí-Renom, M. A., et al. (2000). «Comparative Protein Structure Modeling of Genes and Genomes». Annual Review of Biophysics and Biomolecular Structure 29. Págs. 291-325.
↑ Koonin EV (2005). «Orthologs, paralogs, and evolutionary genomics». Annu. Rev. Genet. 39: 309-38. PMID 16285863. doi:10.1146/annurev.genet.39.073003.114725. Archivado desde el original el 30 de mayo de 2020. Consultado el 5 de diciembre de 2009.
↑ Fitch, W.M. 1970. Distinguishing Homologous from Analogous Proteins. Systematic Zoology Syst Biol 19: 99-113.
↑ OrthoMCL: Identification of Ortholog Groups for Eukaryotic Genomes
Chen F, Mackey AJ, Stoeckert CJ, Roos DS (enero de 2006). «OrthoMCL-DB: querying a comprehensive multi-species collection of ortholog groups». Nucleic Acids Res. 34 (Database issue): D363-8. PMC 1347485. PMID 16381887. doi:10.1093/nar/gkj123.
↑ OrthoMaM
Ranwez V, Delsuc F, Ranwez S, Belkhir K, Tilak MK, Douzery EJ (2007). «OrthoMaM: a database of orthologous genomic markers for placental mammal phylogenetics». BMC Evol. Biol. 7: 241. PMC 2249597. PMID 18053139. doi:10.1186/1471-2148-7-241.
↑ OrthologID Archivado el 24 de febrero de 2014 en Wayback Machine.
Chiu JC, Lee EK, Egan MG, Sarkar IN, Coruzzi GM, DeSalle R (marzo de 2006). «OrthologID: automation of genome-scale ortholog identification within a parsimony framework». Bioinformatics 22 (6): 699-707. PMID 16410324. doi:10.1093/bioinformatics/btk040.
↑ GreenPhylDB
Conte MG, Gaillard S, Lanau N, Rouard M, Périn C (enero de 2008). «GreenPhylDB: a database for plant comparative genomics». Nucleic Acids Res. 36 (Database issue): D991-8. PMC 2238940. PMID 17986457. doi:10.1093/nar/gkm934.

Bibliografía

Jiang, Yu (6 de junio de 2014). «The Sheep Genome Illuminates Biology of the Rumen and Lipid Metabolism» (en science). Consultado el 8 de marzo de 2015.

Datos: Q414601
Multimedia: Sequence homology / Q414601

[1] HOVERGEN: Homologous Vertebrate Genes Database Archivado el 15 de junio de 2012 en Wayback Machine.
Duret L, Mouchiroud D, Gouy M (junio de 1994). «HOVERGEN: a database of homologous vertebrate genes». Nucleic Acids Res. 22 (12): 2360-5. PMC 523695. PMID 8036164. doi:10.1093/nar/22.12.2360.

[2] HOMOLENS: Homologous Sequences in Ensembl Animal Genomes Archivado el 2 de mayo de 2014 en Wayback Machine.
Penel S, Arigon AM, Dufayard JF, et al. (2009). «Databases of homologous gene families for comparative genomics». BMC Bioinformatics 10 (Suppl 6): S3. PMC 2697650. PMID 19534752. doi:10.1186/1471-2105-10-S6-S3.

[3] HOGENOM : Database of Complete Genome Homologous Genes Families

[Pellegrini_1999-4] Pellegrini, M., et al. (1999). «Assigning protein functions by comparative genome analysis: Protein phylogenetic profiles». Proceedings of the National Academy of Sciences (EE.UU.) 96 (8). 4285-4288.

[Martí_Renom_2000-5] Martí-Renom, M. A., et al. (2000). «Comparative Protein Structure Modeling of Genes and Genomes». Annual Review of Biophysics and Biomolecular Structure 29. Págs. 291-325.

[6] Koonin EV (2005). «Orthologs, paralogs, and evolutionary genomics». Annu. Rev. Genet. 39: 309-38. PMID 16285863. doi:10.1146/annurev.genet.39.073003.114725. Archivado desde el original el 30 de mayo de 2020. Consultado el 5 de diciembre de 2009.

[7] Fitch, W.M. 1970. Distinguishing Homologous from Analogous Proteins. Systematic Zoology Syst Biol 19: 99-113.

[8] OrthoMCL: Identification of Ortholog Groups for Eukaryotic Genomes
Chen F, Mackey AJ, Stoeckert CJ, Roos DS (enero de 2006). «OrthoMCL-DB: querying a comprehensive multi-species collection of ortholog groups». Nucleic Acids Res. 34 (Database issue): D363-8. PMC 1347485. PMID 16381887. doi:10.1093/nar/gkj123.

[9] OrthoMaM
Ranwez V, Delsuc F, Ranwez S, Belkhir K, Tilak MK, Douzery EJ (2007). «OrthoMaM: a database of orthologous genomic markers for placental mammal phylogenetics». BMC Evol. Biol. 7: 241. PMC 2249597. PMID 18053139. doi:10.1186/1471-2148-7-241.

[10] OrthologID Archivado el 24 de febrero de 2014 en Wayback Machine.
Chiu JC, Lee EK, Egan MG, Sarkar IN, Coruzzi GM, DeSalle R (marzo de 2006). «OrthologID: automation of genome-scale ortholog identification within a parsimony framework». Bioinformatics 22 (6): 699-707. PMID 16410324. doi:10.1093/bioinformatics/btk040.

[11] GreenPhylDB
Conte MG, Gaillard S, Lanau N, Rouard M, Périn C (enero de 2008). «GreenPhylDB: a database for plant comparative genomics». Nucleic Acids Res. 36 (Database issue): D991-8. PMC 2238940. PMID 17986457. doi:10.1093/nar/gkm934.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]